بهبود عملکرد روش hmm در دیکدر atp گفتار پیوسته فارسی

پایان نامه
  • وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی امیرکبیر(پلی تکنیک تهران) - دانشکده مهندسی برق
  • نویسنده ساناز علیزاده
  • استاد راهنما ابوالقاسم صیادیان
  • تعداد صفحات: ۱۵ صفحه ی اول
  • سال انتشار 1385
چکیده

تغییرات مشخصه آکوستیکی واج ها تحت متن های مختلف موجب شده است که در پیاده سازی سیستم-های بازشناسی گفتار، از واحد های گفتاری وابسته به متن مانند هجا و نیم هجا که اثرات آواهای مجاور را نیز در نظر می گیرند، استفاده شود. با توجه به اینکه زبان فارسی از دسته زبانهایی می باشد که دارای ساختار هجایی ساده ای است، در این تحقیق واحد گفتاری نیم هجا برای مدلسازی طیفی مورد توجه قرار گرفته است و آزمون های متعددی برای تصدیق مطلب فوق در طی انجام پروژه صورت گرفته است. به علت فقدان پایگاه داده فارسی مبتنی بر نیم هجا، تلاش زیادی جهت طراحی متن و جملات مورد نیاز برای پایگاه داده در طی این تحقیق انجام پذیرفته است و داده های گفتاری مربوط به دو گوینده زن و دو گوینده مرد برای ارزیابی مدلها بیان و ضبط شده و به صورت با سرپرستی در سطح واکه و نیم هجا برچسب زده شده است. با توجه به اینکه تشخیص نیم هجاها، ابتدا از آشکارسازی سکوت و واکه آغاز می گردد، در اولین قدم تمام توجه ما به آشکارسازی واکه ها معطوف شده است. در بازشناسی واکه ها، از ترکیب مدل آماری مارکوف پنهان با پارامترهای آکوستیکی مانند انرژی میانگذر استفاده شده است. در این پروژه محدوده واکه ها با بهره مندی از ویژگی های مدل آکوستیکی مانند سادگی، سرعت و ناوابسته بودن آن به گوینده ها، مشخص شده است. سپس با ترکیب نتایج حاصل از پارامترهای آکوستیکی و مدل آماری مارکوف پنهان به نتایج بسیار مناسبی در بازشناسی واکه ها دست یافتیم. در این پروژه در بهترین حالت ها، در گفتار پیوسته به خطای 98/8% و در گفتار گسسته به خطای 87/2% دست یافتیم.

۱۵ صفحه ی اول

برای دانلود 15 صفحه اول باید عضویت طلایی داشته باشید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

بهبود عملکرد مدل ماشین های بردار پشتیبان در دیکدر atp گفتار پیوسته فارسی

درسیستم های بازشناسی گفتار انتخاب واحد گفتاری مناسب، از اهمیت ویژه ای برخوردار است. جهت انتخاب واحد آکوستیکی مناسب، در نظر گرفتن ساختار و ویژگی های زبان مورد استفاده، بسیار مهم است. با توجه به این که ساختار هجایی زبان فارسی تقریبا همانند زبان های هندی، چینی و ژاپنی ساده و محسوس است، در این تحقیق، واحد زیر کلمه نیم هجا به عنوان واحد آکوستیکی مناسب در زبان فارسی مورد توجه ما قرار گرفته است. با تو...

15 صفحه اول

معرفی شبکه های عصبی پیمانه ای عمیق با ساختار فضایی-زمانی دوگانه جهت بهبود بازشناسی گفتار پیوسته فارسی

In this article, growable deep modular neural networks for continuous speech recognition are introduced. These networks can be grown to implement the spatio-temporal information of the frame sequences at their input layer as well as their labels at the output layer at the same time. The trained neural network with such double spatio-temporal association structure can learn the phonetic sequence...

متن کامل

بررسی تاثیر سرعت گفتار روی زمان شروع واک (وی اُتی) همخوان های انسدادی فارسی معیار در گفتار پیوسته

مطالعۀ حاضر به بررسی تأثیر سرعت گفتار روی زمان شروع واک (وی‌اُتی) همخوان‌های انسدادی واکدار /b, d, ɟ/  و بیواک /p,t,c/  زبان فارسی معیار می‌پردازد. به این منظور، طی آزمون تولیدی تعداد 8 جمله حاوی کلمات آزمایش، هر کدام 3 مرتبه توسط 24 شرکت ‌کننده (17 شرکت ‌کنندۀ مؤنث و 7 شرکت ‌کنندۀ مذکر) در سرعت‌های متفاوت تولید شدند. مقادیر وی‌اُتی برای همخوان‌های انسدادی واکدار و بیواک به تفکیک موقعیت در واژه (...

متن کامل

بهبود عملکرد سیستم بازشناسی گفتار پیوسته بوسیله ویژگی‌های استخراج شده از مانیفولدهای گفتاری در فضای بازسازی شده فاز

The design for new feature extraction methods out of the speech signal and combination of their obtained information is one of the most effective approaches to improve the performance of automatic speech recognition (ASR) system. Recent researches have been shown that the speech signal contains nonlinear and chaotic properties, but the effects of these properties are not used in the continuous ...

متن کامل

بازشناسی احساس از روی گفتار پیوسته فارسی

در سالهای اخیر بازشناسی احساس به عنوان روش جدیدی برای تعامل انسان با کامپیوتر مورد توجه و موضوع تحقیقات زیادی بوده است. احساس، در قالب حرکات چهره، گفتار، حرکات دست و بدن و علایم زیستی مانند ضربان قلب بروز می یابد. مدل پیشنهادی در این پایان نامه از گفتار پیوسته فارسی برای بازشناسی احساس استفاده می کند. بازشناسی احساس از گفتار بر روی زبان های مختلفی انجام شده اما بر روی زبان فارسی تا کنون این چن...

تقطیع هجایی گفتار پیوسته فارسی با استفاده از آستانه‌گذاری ضرایب موجک و نرم‌سازی فازیِ تابع انرژی

امروزه در تحقیقات حوزه پردازش و بازشناخت گفتار، هجا به دلیل ارتباط قوی آن با تولید و ادراک گفتار در انسان، به عنوان یک واحد زیرکلمه‌ای هر روز بیشتر مورد توجه قرار می‌گیرد. آشکارسازی خودکار مرزهای هجایی گامی مهم در تحقیقات مرتبط با نوای گفتار، تولید گفتار طبیعی و حتی بازشناسی گفتار است. در این مقاله روش جدیدی برای آشکارسازی خودکار مرزهای هجایی در سیگنال گفتار پیوسته فارسی با تکیه بر اطلاعات صوتی...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی امیرکبیر(پلی تکنیک تهران) - دانشکده مهندسی برق

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023